前言 我們繼上一篇討論以下功能: 除錯(Debug)。 測試案例生成(Test case generation)。 衡量效能(Performance mert...
嗨!大家好!我是Eva!一位正努力跨進資料科學領域的女子!沒想到寫著寫著 30 天的日子就這樣過去了,能完成挑戰實在太感動了 😭 ■ 系列回顧 在這 30 天挑...
■ 題目|Interview Query - Customer Analysis You’re given a dataframe containing sal...
■ 題目|Interview Query - Complete Addresses You’re given two dataframes. One conta...
■ 題目|Interview Query - Impute Median You’re given a dataframe df_cheeses contain...
■ 題目|Interview Query - Rain on Rainy Days You’re given a dataframe df_rain conta...
■ 題目|Interview Query - Over 100 Dollars You’re given two dataframes: transaction...
先前,我們大約花了三週的時間學習 Pandas 的操作,是時候好好驗收學習成果了!從今天開始,我將每天和大家分享一道題目,親自撰寫解法,並提出我的解題思維,...
Python 中,除了 Matplotlib 適合用於資料視覺化之外,Seaborn 也是一個好用的函式庫,兩者經常會放在一起介紹或者使用,今天就和大家聊聊...
Pandas 是 Python 生態系中,適合用來做資料分析或機器學習的套件,上一篇文章介紹 Pandas 中對新手相當友善的繪圖函數 plot( ) ,讓...
簡報時,我們常會聽到「用數字說話」這句話,面對主管、同事真的是講出每個數字就能讓聆聽者理解嗎?錯!大部分的人單看數字都容易眼花撩亂,想讓對方理解你的報告,圖...
VS Code 的使用者應該有發現 Pandas 的輸出結果有時並不是那麼好閱讀,對於一個有版面強迫症的我來說,曾經因為 DataFrame 歪掉的格式十分...
Excel 本身提供方便的樞紐分析,但你有想過用程式該如何撰寫嗎?今天就來分享一下 Pandas 中的樞紐分析:pivot_table( ) 一起透過交叉分...
在大型數據當中,有時我們會需要透過群組的方式概括整體資料,除了用以觀察之外,也能進一步深入處理,本文將分享如何使用資料的分組和聚合操作,內容包含: 資料分...
在進行資料專案時,模型是基於數學設計的,有些資料型態不適合模型存取,為了提高數據的可用性和模型的處理,本文將以案例說明如何進行資料型態轉換,內容包含: 介...
除了採用「刪除」的方式清理資料外,為確保數據的完整性,「填補」的操作也是另一種常見的方式,本文將說明資料清理中有關填補的操作方法,內容包含: 常數填補 統...
資料在產生或蒐集時可能因為各種原因出現缺失值(Missing Value),導致資料集中缺少某些觀測值或該值無法表示或測量,因此,處理缺失值是數據分析中很重...
嗨!大家好!我是Eva!一位正努力跨進資料科學領域的女子!這是我首次撰寫技術文章,也是第一次挑戰30天日更,希望能挑戰成功!第一篇文章,就讓我簡單介紹參賽動機、...
Hi, Day30, 終於來到這次鐵人賽的final了~ 這個月把很多不藏私的小技巧分享給大家, 目的其實不在於炫技, 是希望讀者大家們除了學習到一開始的資料清...
Electricity grids are required to operate under reliability and integrity of dat...